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PROCEDE DE DETECTION D'ACTIVITE VOCALE. 



_ Le signal de parole numerique (s) traite par trames 
successives est soumis a un debruitage en tenant compte 
d'estimations du bruit compris dans le signal, mises a jour 
pour chaque trame d'une maniere dependants d'au moins 
un degre d'activite vocale (7^, On precede a un debruitage 
a priori du signal de parole de chaque trame sur la base 
d'estimations du bruit obtenues lors du traitement d'au 
moins une trame precedente, et on analyse les variations 
d'energie du signal debruite a priori pour detecter le degre 
dactivite vocale de iadite trame. 
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PROCEDE DE DETECTION D' ACTIVITE VOCALE 

La presente invention concerne les techniques 
nurr.eriques de traitement de signaux de parole. Elle 
concerne plus particulierement les techniques faisant 
appel a une detection d' activite vocale afin d'effectuer 
des traitements differencies salon que le signal supporte 
ou non une activite vocale. 

Les techniques numeriques en question relevent de 
domaines varies : codage de la parole pour la transmission 
ou le stockage, reconnaissance de la parole, diminution du 
bruit, annulation d'echo... 

Les methodes de detection d' activite vocale ont 
pour principale difficulte la distinction entre 1' activite 
vocale et le bruit qui 1' accompagne . Le recours a une 
technique de debruitage classique ne permet pas de traiter 
cette difficulte, puisque ces techniques font elles-memes 
appel a des estimations du bruit qui dependent du degre 
d' activite vocale du signal. 

Un but principal de la presente invention est 
d'ameliorer la robustesse au bruit des methodes de 
detection d' activite vocale. 

L' invention propose ainsi un precede de detection 
d' activite vocale dans un signal de parole numerique 
traite par trames successives, dans lequel on soumet le 
signal de parole a un debruitage en tenant compte 
d' estimations du bruit compris dans le signal, mises a 
jour pour chaque trame d' une maniere dependante d' au moins 
un degre d' activite vocaieV;,. determine pour, ladite trame. 
Selonl' invention, on procede;; a un,.. ,de^bruitage a, priori du 
U signal, 'cle.^arole de chaque t'rame sur 'la bas'e ci:,estimations 
,du bruit .obtenues lors cu 'traitement ' d' au Aoihs une trame 
•■ precedenfe,. et " on analyse., les .variations d'^^^nergie du 
signal "debruite a priori pour detecter le degre d' activite 
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vocaie de iadite crame. 

Le fait de proceder a la detection d'activite 
vocaie (selon une methode qui peut genera iement etre toute 
rriechode connue) sur la base d' un signal debrui^e a priori 
ameiiore sensiblement les performances de cette detection 
lorsque le bruit environnant est relat i vement important. 

Dans la suite de la presente description, on 
illustrera le procede de detection d' activite vocaie seion 
1' invention dans un systeme de debruitage d'un signal de 
parole. On conprendra que ce procede peut trouver des 
applications dans de nombreux autres types de traitement 
numerique de la parole dans lesquels on souhaite disposer 
d'une information sur le degre d'activite vocaie du signal 
-raite : codage, reconnaissance, annula~ion d'echo... 

D' autres part icular it es et avantages de la 
presente invention apparal'ront dans la description ci- 
apres d'exemples de realisation non limitatifs, en 
x^eference aux dessins annexes, dans lesquels : 

- la figure 1 est un schema synoptique d'un 
systeme de debruitage mettant en oeuvre la presente 
invention ; 

- les figures 2 et 3 sont des organigrammes de 
procedures utilisees par un detecteur d'activxce vocaie du 
systeme de la figure 1 ; 

- la figure 4 est un diagramme representant les 
etats d'un automate de detection d'activite vocaie ; 

la figure 5 est un graphique illustrant les 
variations d'un degre d'activite vocaie ; 

- la figure 6 est un schema synoptique d'un module 
de surest imat ion du bruit du systeme de la figure 1 ; 

la figure 7 est un graphique illustrant le 
calcul d' une courbe de masquage ; et 

la figure 8 est un graphique illustrant 
1' exploitation des courbes de masquage dans le systeme de 
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la figure 1 . 

Le systeme de debruitage represente sur la figure 
1 traite un signal numerique de parole s. Un rnodule de 
fenetrage 10 met: ce signal s sous fcrrae de fenerres ou 
trames successives, ccnstituees chacune d'un nombre N 
d' echantillons de signal nurr.erique. De fagon classique, 
ces -rames peuvent presenter des recouvrement s mutuels. 
Dans la suite de la presente description, on considerera, 
sans que ceci soit limitatif, que les trames sont 
constituees de N=256 echantillons a une frequence 
d' echantillonnage de 8 kHz, avec une ponderation de 

Hamming dans chaque fenetre, et des recouvrements de 50% 
entre fenetres consecut i ves . 

La zrame de signal est transform:ee dans le comaine 
frequentiel par un module 11 appliquant un algorithme 
classique de transformee de Fourier rapide (TFR) pour 
calcuier le module du spectre du signal. Le module 11 
delivre alors un ensemble de N=256 composantes 
f requentielles du signal de parole, notees S^,^ ou n 
designe le numero de la trame courante, et f une frequence 
du spectre discret. Du fait des proprietes des signaux 
nuneriques dans le domaine frequentiel, seuls les N/2=128 
premiers echantillons sont utilises. 

Pour calcuier les estimations du bruit contenu 
dans le signal s, on n' utilise pas la resolution 
f requentielle disponible en sortie de la transfcrmee de 
Fourier rapide, mais une resolution plus faible, 
determinee par un nombre I de bandes de frequences 
couvrant la bande ;0,F^/2] du signal. Chaque bande i 

(l<i<l) s'etend entre une frequence inferieure f(i-l) et 
une frequence superieure f;i)/ avec f(0)=0, et f(I)=F^/2. 
Ce decoupage en bandes de frequences peut etre uniforme 
(f (i) -f (i-1) =F^/2I) . 11 peut egaiement etre non uniforme 
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(par exenple selon une ec'r.eile ce barks). Un module 12 
caicuie les moyennes respeczives ces composantes 
soecrales S ^ du sional de carole par bandes, par 

exenple par une ponderation uniforn^e telle que : 

S • - Z 5„ ^ (1) 

^ f €[f(--:: ,5(4 

Cg moyennage dimir.ue les fluctuations entre les 
bandes er. moyennant: les contr ibuzions cu bruit dar.s ces 
bandes, ce qui diminuera la variance de I'estimateur de 
bruit, Zn outre, ce moyennage perrr.et une forte diminution 
de la conplexite du systeme. 

Les composantes spectrales moyennees ^n,i 

adressees a un module 15 ce detection d'activite vocale et 
a un module 16 d' estimation du bruit. Ces deux modules 15, 
16 fonctionnent con] ol ntement , en ce sens que des degres 
G'activite vocale ^ mesures pour les d.fferentes bandes 

par le module 15 sont utilises par le module 16 pour 
est imer I'energie a long terme du bruit dans les 
differentes bandes, tandrs que ces estimations a long 
^^^me ^ sont utilisees oar le module 15 pour oroceaer a 

un debruitage a prion du signal de parole dans les 
differentes bandes pour determiner les degres d'activite 

vocale : . 

Le f onct ionnement des modules 15 et 16 peut 
correspondre aux organigrarjnes representes sur les figures 
2 et 3. 

Aux etapes 17 a 20, le module 15 precede au 
deoruitage a priori du signal de parole dans les 
differentes bandes i pour la trame de signal n. Ce 
debruitage a priori est effectue selon un processus 
classique ce soustraction spectrale non linealre a partir 
d' est imations du bruit obtenues Icrs d' une ou piusieurs 
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-ranfies precedences. A i'etape 17, le . mcduie 15 calcule, 
avec la resolution des candes la reponse en frequence 

Hd . du tilzre de debrui-age a prion, selcn la formule : 

- ' / 

ou Tl ec t2 sont des retards exprines en noir^Dre de cra.T.es 
{xl>l, x2>0) , e~ aL ^ est ur. coefficient de surestimat ion 
du bruit dont la deter-\ina tier, sera expliquee plus loin, 
le retard zl peut etre fi.xe !oar exemple t1 = 1) ou 
variable. II est d' autant plus faible qu'cr. est cor.fiar.t 
dans la detection d'activite vocale. 

.a.ux etapes 18 a 20, les cc~posantes spectraies 

^ sont calculees selon : 

ou Ppj_ est un coefficient de plancher proche de 0, servant 
classiquement a eviter que le spectre cu signal debruite 
prenne des valeurs negatives ou trcp faibles qui 
prcvoqueraien t un bruit musica_ . 

Les etapes 17 a 20 consistent done essent iel lement 
a soustraire du spectre du signal une estiT^at ion, majoree 
par le coefficient a'^_^^^ y , du spectre du bruit estime a 
priori , 

A I'etape 21, le module 15 calcule I'energie du 
signal debruite a priori dans les differentes bandes i 

pour la tra-e n: E^^^=£p^^^. 11 calcule aussi une 

-loyenne globale E^^q de I'energie du signal debruite a 

priori, par une somne des energies par bande ^n,i' 

ponderee par les largeurs de ces banaes. Dans les 
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r.o::ations ci-dessous, I'indice i = 0 sera utilise pour 
desigr.er la bande glcbaie du signal. 

Aux ecapes 22 et 23, le nocule 15 calcuie, pour 
chacue bance i (0<i<I), une arandeur AE;^ • reoreser.car.c 

la variation a cour^ zerrae de I'energie du signal debruite 
dans la bande i, ainsi qu'une valeur a long ter.-ne de 

I'energie du signal debruite dans la bande i. La grandeur 
AE:_ ^ peer etre calculee par une formule simplifiee de 



derivation : AE^ v = ; 

\ 



Quan- a 



10 I'energie a long teme ^n^i^ elle peut etre calculee a 
I'aide d' un facteur c' oubli 31 tel que 0<B1<1, a savoir 

r^,, = 31 . + (i-5i; . r^,, . 

Aores avoir calcule les energies ■ du signal 

debruite, ses variations a court terme AE^ . et ses 

15 valeurs a long terrrie En^i de la maniere indiquee sur la 
figure 2, le module 15 calcule, pour chaque bande i 
(0<i<I), une valeur representative de I'evolution de 

I'energie du signal debruite. Ce calcul est effectue aux 
etapes 25 a 36 de la figure 3, executees pour chaque bande 
20 i entre i=0 et i=: . Ce calcul fait appel a un estimateur a 
long terme de I'enveloppe du bruit ba^^, a un estimateur 

interne bi; et a un compteur de trames bruitees b^^ . 

A I'etape 25, la grandeur A£_ • est comparee a un 
seuil el. Si le seuil el n'est pas attemt, le compteur b- 

25 est increnente d' une unite a I'etape 26. A I'etape 21, 
- 1 ' es t imateur a long terme ba^ est compare a la valeur de 
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i'energie lissee Z^,. • Si ha ,^>l^, , i'estima.eur ba^ est 
oris egal a ia valeur lissee in,x a I'etape 28, et le 
corr.c-eur b, est re-is a zero. La grap.deur p^, qui est 
prise egaie au rapport ba^/£n,i (ezape 36), est alcrs 
egale a 1. 

Si I'etape 27 montre que baj_<Eri,i , le compteur 
est compare a une valeur liraite bmax a I'etaoe 29. 3i 
b.>o.T.ax, le signal est considere corarr.e trop stationnaire 
pour supporter de I'activite vocale. L' etape 28 precitee, 
aui revient a considerer que la trame ne comporte que du 
bruit, est alors executee. Si b^<bmax a I'etape 29, 
I'estimateur interne bi^ est calcule a i'etape 33 selon : 

Dans cette forrr.ule, Bm represente un coefficient de raise a 
jour compris entre 0,90 et 1. 3a valeur differe selon 
I'etat d'un automate de detection d'activite vocale 
(etapes 30 a 32). Get etat 6.,_-_ est celui deter-ine lors 
du traiterr.ent de la trarr.e precedente. Si 1' automate est 
dans un etat de detection de parole (5j.^_i = 2 a I'etape 30), 
le coefficient Bm prend une valeur 3mp tres proche de 1 
pour que I'estimateur du bruit soit tres faiblement mis a 
jour en presence de parole. Dans le cas contraire, le 
coefficient 3m prena une valeur 3ms plus faible, pour 
permettre une mise a :our plus significative de 
I'estimateur de bruit en phase de silence. A I'etape 34, 
I'ecart ba^-bi^ entre I'estimateur a long terme et 

I'estimateur interne du bruit est compare a un seuil e2 . 
Si le seuil t2 n' est pas atteint, I'estimateur a long 
terme ba^ est mis a jour avec la valeur de I'estimateur 
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ir.ierne bi^ a I'etape 35. Sinon, 1' est iniateur a lone terr.-e 

za: resze inchange. On evite ainsi que de bru-ales 

variazicr.s dues a ur. signal de parole ccnduiser.c a une 
n-.ise a jour de 1 es t imaceur de bruit. 

Apres avoir obcenu les grandeurs , ie xodule 15 

precede aux decisions d'activite vocale a I'etape 37. Le 
rr.oduie 15 raez d'abord a jour I'etat de 1' automate de 
detection selon la grandeur pQ calcuiee pour 1' ensemble de 

la bande du signal, le nouyel etat 5^ de 1' automate depend 

de I'etat precedent 5n-i ®^ Pq' maniere 

representee sur la figure 4. 

Quatre etats sent possibles : 6=0 detecte le 
silence, ou absBr.ce de parole ; 5=2 detecte la presence 
d' une activite vocale ; et les etats 6=1 et 5=3 sont des 
etats intermediaires de montee et de desceniie. Lorscue 
I'automate est dans I'etat de silence (S^_-=0), 11 y reste 

si Pq ne depasse pas un premier seuil SIl, et il passe 

dans I'etat de montee dans le cas contraire. Dans I'etat 
de montee {6^^_-j^ = l), il revient cans I'etat de silence si 

pQ est plus petit que le seuil S£l, il passe dans I'etat 

de parole si Pq est plus grand qu'un second seuil SE2 plus 

grand que le seuil SEl, et il reste dans I'etat de montee 
si 3Z1< Pq<3Z2. Lorscue I'automate est dans I'etat de 

parole (6„_-j^ = 2), il y reste si pg depasse un troisieme 

seuil SE3 plus petit que le seuil 5E2 , et 11 passe dans 
I'etat de descente dans le cas contraire. Dans I'etat de 
descente '^n-l"^^' ' I'automate revient dans I'etat de 
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parole si pQ est plus grand que le seuii 3E2, il revienz 
dans I'ezaz de silence si Pq est en ceca d' un quacrieme 
se--il SE4 plus petit que le seuix SZ2 , ez il reste cans 
I'etat de descente si SE:4<Pq<SE2. 

A I'etape 37, le T.cdule 15 calcuie egalerr.ent les 
degres d'activite vocale y^^^ ^ dans chaque bande i>l. Ce 
degre - est de preference un para.T.etre non bmaire, 

c'est-a-dire que la fcnction Yn^i^^tPx' '^st une fonction 
variant continument entre 0 et 1 en fonction des valeurs 
prises par la grandeur p^ . Cette fonction a par exerr^ple 

I'allure representee sur la figure 5. 

Le module 16 calcule les estimations du bruit par 

bande, qui seront utilisees cans le processus ce 

debruitage, en utiiisant les valeurs success ives des 

comoosantes , et ces degres d' activite vocale - • 

Ceci correspond aux etapes 4C a 42 de la figure 3. A 
I'etape 40, on determine si 1' automate ae detection 
d' activite vocale vient de passer de I'etat de montee a 
I'etat de parole. Dans 1 ' af f irmat ive , les deux dernieras 
estimations ^r^-i^i ^n-2,i precedemjr.en t calcclees pour 

chaque bande i>l sont corrigees conformement a la valeur 
de 1' estimation precedente B^_3,i - Cette correction est 
effectuee pour tenir com.pte du fait que, dans la phase de 
m.ontee (5=1), les estim.ations a long term^e de I'energie du 
bruit dans le processus de detection d' activite vocale 

(etapes 30 a 33) ont pu etre calculees comm.e si le signal 
ne com.portait que du bruit (Bm=3ms), de sorte qu'elle 

risquent d'etre entachees d'erreur. 

A I'etape 42, le module 16 met a jour les 
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es'li.T.arions du bruit par bande seion ies formules : 

S_ • = 7„ * (1-V„ :) . 3„ ; (6) 

ou Ag designe un facteur d'oubii tel que Q<X^<\ . La 
formuie (6) met en evidence la prise en compce du cegre 
d'activite vocaie non binaire 

**/-*- 

CoTLT.e indique precederxp-en t , ies estimations a long 
terT.e du bruit 3^^^ font I'objet d'une surestirnat ion, par 

un module 45 (figure 1), avant de proceder au debruitace 
par soustraction spec~rale non lineaire. Le module 45 

calcule le coefficient de surest imat ion precede.Tjmen t 

« I 

e^^oque, ainsi qu' une estimation majoree ^ri,L 

corresponc essentiellement a ai^^^,3^^j_, 

L' organisat ion. du module de surest imat ion 45 est 
reoresentee sur la figure 6. 1' estimation ma^oree ^-^^v est 

obtenue en combinant 1' est imat ion a long terme 3^^^^ ez une 

mesure ABI^^^ de la variabilite de la composante du bruit 

dans la bande i autour de son estimation a long terme. 
Dans I'exemple considere, cette combinaison est, pour 
I'essentiel, une simple somme realisee par un additionneur 
45- Ce pour rait egalement etre une somir.e pcnderee, 

Le coefficient de surest im.at ion a. est egal au 

raooort en-re la sorrLrr.e 3^ + A3;„'^,^' delivree oar 
1 ' addit ionneur 46 et^ 1 ' est imat-io'n a long terme retardee 
^n-T3,i (tiiviseur 4 7 ) v' ;p:ia f onne'^ a une vaieur limite cc^^^/ 



2768544 



11 

par exerr.ple cx^^^^=4 (bloc 43) . Le regard t3 sert a corriger 
le cas echeant, dans les phases de Tr.or.zee (6=1), ia valeur 

1 

du coefficient de sures:: ima" ion a., , , avant que ies 
est:Lmat ions a long zer??.e aien:: ete corrigees par les 
etapes 40 et Al de la figure 3 (oar exer.ple t3 = 3) . 

L' escir:^.ar ion majoree S^^j; est finalement prise 
egale a a'^^^. 3.^_^2,i I-'^ul-iplieur 49) . 

La mesure ^3^^^f de la variabiliie au bruit refleie 
la variance de 1 ' est imateur de bruit. Elle est obtenue en 
f one t ion des valeurs de ^ et de B^^j_ ca leu lees pour un 

certain nonbre de trames precedentes sur lesquelles le 
signal de parole ne presente pas d'activite vocale dans la 

oande i. Cest une foncticn des ecarts j'^^-j_;c,i ~ ^n-k^i 

caleules pour un norabre K de trames de silence (n-k<n; , 
Dans I'exemple represente, cette fonetion est simple.t^.ent 
le rn.axiT.ur^ (oloc 50). Pour ehaque trarr.e n, le degre 
d'activite vocale • est coT;pare a un seuil . (bloc 51) 



oour decider si I'ecart 



, caleule en 52-53, doit 



ou non etre charge dans une file d'attente 54 de K 
emplacements organisee en mode premier ent re-premier sort! 

(FirO). Si 1 ne depasse pas le seuil (qui peut etre 

n , 1 

egal a 0 si la fonetion g() a la forme de la figure 5), la 
riFO 54 n'est pas alimentee, tandis cu'elle I'est dans le 
cas contraire. La 'valeur maximale contenue dans la FIFO 54 

est alors fournie comme mesure de variaoilite AB^^^^' , 

La mesure de variabilite ^^ri^l' P^ut, en variante, 



I 
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e"re oczenue en fcn.ctior. des valeurs S^^^^_- (ee r.o' ^p;^ _ 
3^ ; . Or. procede 'alors de la rr^eme maniere, sauf que ia 



FIFO 54 con-ienc non pas - 3^_'^^^^ pour cr.acune des 

bandes i, mais plucdi max }s^_^ f - 

Grace aux estimations incependantes des 
f luc-uacions a long ^erme du bruit ^n,:. 

variaoilite a court terne ^B^^'f , I'estimateur rr.ajore 3„^v 

procure une excellente robustesse aux bruits musicaux du 
procede de debruitage. 

Une premiere pnase de la soustraction spectrale 
est realisee par le module 55 represente sur la figure 1. 
(3^--e phase fournit, avec ia resolution des bandes i 

(l<i<I), ia reponse en frequence h'^-^j^ d'un premier f:-ltre 
de debruitage, en fonction des composantes S^^^^ ^ et 3^^^^ et 

des coefficients de suresuimacior. • calcul peur 

etre effec-ue pour chaque bande i selon la forrr.ule : 

.-naxjs _^ - "n,i- ' ^'v ^n,i\ 
= ^ J—- ^ (7) 

oil t4 est un retard entier determine tel que t4>0 (par 

exemple t4 = 0). Dans I'expression (7), le coefficien* (3;- 

represente, comme le coefficient /ip ^ de la formule (3;, un 

plancher servant class iquement a eviter les valeurs 
negatives ou trop faibles du signal debruite. 

De fagon connue (EP-A-0 534 837), ie coefficient 

de surest imat ion a_ oourrait etre remplace dans la 
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:cr:T\uie (7) par un autre coefficient egal a une fonctior. 
de a' , ez d' une- eszL-azion du rappor- s ignal-sur-orui" 
(oar exerr.oie j / 3^ -■ ) , cezze fonc-ior. e-an. decrcissanza 
selon la valeur esrimee du rapporz sxgnal-sur-oruic. Cetce 
fcnction esz alors egaie a a'^^^ pour les valeurs les plus 

faxbles du rapporr signal-sur-brux t . En effec, lorsque ie 
signal est tres bruite, ii n'est a prion pas utile de 
diT.muer le facteur de sures t inat ion . Avantageuserr.enr , 
cette fonction decroit vers zero pour les valeurs les plus 
elevees du rapport signal/bruit, Ceci permet de proteger 
les zones les plus energeticues du specrre, ou le signal 
de parole est le plus sicnif icatif , la quantite soustrai^e 
du signal tendant alors vers zero- 

Cezze strategie peut e;:re affinee en I'appiiquant 
de rr.aniere selective aux harmoniques de la frequence 
zonale (« pitch ») du signal de parole lorsque celui-ci 
presente une activi^e vocale. 

Ainsi, dans la realisation representee sur la 
figure 1, une seconde phase ce debruitace est realisee par 
un module 56 de protection des ha rn^.on iques . Ce r.odule 
calcule, avec la resolution de la transformee de Fourier, 

la reponse en frequence h't^^f d' un second filtre de 

debruitage en fonction des parametres ^^'^^^i/ ^n,i' ^n,i' 

0,3 , et de la frequence tonale f^=r^/T^ calculee en 
n n ^ 1 ' 

dehors des phases de silence par un module d' analyse 
narmonique 57 . En phase de silence (^r-.^- ) , le module 56 

n'est pas en service, c'est-a-dire que Ht^^f = Hz^^^ pour 

chaque frequence f d' une bande i . Le module 57 peut 
appliquer toute methode connue d' analyse du signal de 
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parole de ia trarr^e pcur deter-Tiiner la periode T^, exprimee 

ccrrjT.e un r.crabre entier ou f rac - Icr.r.aire d' ecr.antiillons , 
par exencle une r.ethode de predicnion lineaire. 

La procec"ion appor^ee par le module 56 peu~ 
consis^er a effec-uer, pour c'r.aq'ce frequence f appartenanc 
a une bande i : 



= 1 si < 



et 3r| en tier / 



(8) 



< Af / 2 (9) 



Ht, ^ = Ht, s sinon 



^f=f^/N represente la resolution spectrale de la 

cransformee de Fourier. Lorsque Ht,^f=l, la quan::ite 
soustraxte de la composante ^rx^r sera nulle, Dans ce 
calcul, les coefficients ce plar.cher (par exer.ple 

p^. = [i^ ) expriment le fait que certaines harmoniques ce la 
frequence tonale f^ peuvent etre masquees par du bruit:, de 

sorte qu' 11 n' est pas utile de les proteger. 

Cette strategie de protection est de preference 
appliquee pour chac\:.r.e des frequences les plus proches des 

harnoniaues de f^, c'est-a-dire oour r| entier quelconque. 

P 

Si on designe par 6fp la resolution frequent ielle 

avec laquelle le module d' analyse 57 produit la frequence 
tonale estimee f^^, c'est-a-dire que la frequence tonale 

reelle est comprise entre -o~^~p^^- ^" ^p'^^^p^*^' alors 
I'ecart entre la r|-ier:.e harmonique de la frequence tonale 
reelle est son estlT.ation n^^o ^ ^^of^-^^^i*^^^ peut aller 

jusqu'a ±r|x5fp/2. Pour les valeurs elevees de r|' <=^t ecart 
peut etre superieur a la demi-resolut ion spectrale Af/2 de 
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.a transEorT.ee de Fourier. Four tenir compce de cer-e 
.-certitude et garantir la bcr.r.e projection des 
^armoniques ce la frequence tonale reelle, on peut 
iroteger chacune des frequences de I'intervalle 

[rixf^- Tix6rp/2 , rixfpH- nx6fp/2], c'est-a-dire remplacer la 
condition (9) ci-dessus par : 

3T1 entier / \f - ^. fj\ ^ 5fp + Af)/2 (9' ) 

Cette facpon de proceder (condition (9')) presente un 
mteret particuiier lorsque les valeurs de n peuvent etre 
grandes, notanunent dans le cas ou le procede est utilise 
dans un systeme a bande eiarcie. 

Pour chaque frequence protegee, la reponse en 

frequence corrigee H^^^ peut etre egale a 1 corrjr.e indique 

ci-dessus, ce qui correspond a la soustraction d' une 
quantite nulla dans le cadre de la soustraction spectrale, 
c'est-a-dire a une protection complete de la frequence en 
question. Plus gene rale-.ent , cette reponse en frequence 

corrigee ff^ ^ pourrait etre prise egale a une valeur 

ccT.prise entre 1 et H^^^ selon le decre de protection 
souhaite, ce qui correspond a la soustraction d' une 
quantite inferieure a celie qui serait soustraite si la 
frequence en question n' etait pas protegee. 

Les composantes spectrales ■^n,if ''^^ signal 

debruite sont calculees par un .nr.ult ipl ieur 53 : 



S ^ (10) 



Ce signal f est fourni a un module 60 qui 

calcule, pour chaque trame n, une courbe de masquage en 
appliquant un modele psychoacoustique de perception 
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1 O 

auGi::ive par i'oreiiie humaine. 

Le phenomene de mascuage est un principe connu du 
f cnct iop-nement de I'oreille humair.e. Lorsque deux 
frequences sont encendues simuizaneman- , ii es~ possible 
que I'ur.e des deux ne soit plus audible. On dit alors 
qu'elle est: masquee. 

II existe differences methodes pour calculer des 
courbes de masquage. On peut par exer^.ple utiliser celle 
developpee par J.D. Johnston («Transforn Coding of Audio 
Signals Using Perceptual Noise Criteria », IEEE Journal on 
Selected Area in Communications, Vol. 6, No. 2, 
fevrier 1983). Dans cetce methode, on travaille dans 
I'echelle f requentielle des barks. La courbe de mascuage 
est vue com.T.e la convolution de la fonction d'etalement 
spectral de la membrane basilaire dans le domaine bark 
avec le signal excitateur, conscitue dans ■ la presente 

-1 

aoolication car le sicnal St ^ - La fonction d'etalement 
- *• *■ " * ^ /— 

soectral peut etre modelisee de la maniere representee sur 

la figure 7. Pour chaque bande de bark, on calcule la 

contribution des bandes inferieures et superieures 

convoluees par la foncticn d'etalement de la membrane 

basilaire : 

_ ^n,q' ^ ^n,q' 



ou les indices q et c/ designent les bar:des de bark 



(0<q,q'<Q), et ^. represente la^.moyenne des compcsantes 



i 

jr du signal excitateur debruiee pour les frequences 
discretes f appartenant a la ba-nde. de bark q' . 



Le seuil de mascuage est obtenu par le module 

- !■ ^ q 

lei .(.' 

60 pour c'r.aque bande de bark q;'*selon la formula : 
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-■r:,q n,q q 

cu R depend du caractere plus ou mo^ns voise du sigr.al. 

3e fa(;on ccnnue, une forne possible de est : 

iO.log^Q(Rq) = (A-q).X - 3.(l-x' (13) 

avec A=14,5 et 3=5,5. x designe un degre de voisemen- du 
signal de parole, variant entre zero (pas de voisement 
1 (signal forterr.enr: voise) . Le cararr.erre x etre c 

fcr-e conr.ue : 

{ SFM 1 



et 
la 



(12; 



10 cu SFM represente, en decibels, le rapport e-.tre la 
.-.cyep.ne arithrneticue et la T.cyenne qecrr.et rique de 
I'energie des bandes de bark, et SFM^^^j^^ — 60 dB. 

Le systeme de debruitage corr.porte encore un rr.ocule 
62 qui corrige la reponse er. frequence du filtre de 

15 debruitage, en fonction de la ccurbe ae masquage M^^^^^ 

calculee oar le rr.odule 60 et des estirnat i.ons majorees 3„^_; 

calculees par le module 45. Le rr.odu-e 62 decide cu niveau 
de debruitage qui doit reellernent etre atteint. 

En comparant I'enveloppe de 1' estimation majoree 
20 du bruit avec I'enveloppe formee par les seuils de 
masquage M^^ ^, on decide de ne debruiter le signal que 

dans la nesure ou 1 ' est ir.at ior. majoree 3_^^^ depasse la 
courbe de n^.asquage. Ceci evite de suppri.-.er inutiiement du 
bruit masque par de la parole. 
25 La nouvelle reponse -^.n^^ / pour ur.e frequence f 

appartenant a la bande i definie par le module 12 et a la 
bance da bark q, depend ainsi de I'ecart relatif entre 
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* ' ■ 

^'-s^inacion majoree ; de la ccT.cosante 5pectra-.e 

ccrrespondante du bruit et la ccurbe de riasquage M-.^^^/ de 
la mar.iere suivance : 



,01- (14) 



En d'autres terrr.es, la quantite souscraite d' une 
composante spectrale ^p., f dans le processus de 
scusi:raccion spec-rale ayan" la reponse frequent ielle 

H' , est sensiblement egale au rainimur?. entre d' une part 
* * n / - 

la quantite soustraite de cette corr.pcsante spectrale dans 
le processus de soustraction spectrale ayant la reponse 

f requentielle ^n.f d' autre part la fraction de 

1' estimation majoree 3*^^^ de la composante spectrale 

ccrrespondante du bruit qui, le cas echear.z, depasse la 
courbe de masquage ^^^^q- 

La figure 8 illustre le principe de la correction 
apoliquee par le module 62. Elle montre scnemat iquement un 
example de courbe de masquage M^^ ^ calculee sur la base 

des composantes spectrales 5t,^ _ du signal debruite, amsi 

que 1' estimation majoree B^^j^ du spectre du bruit. La 

quantite finalement soustraite des composantes ^^.^f sera 

celle representee par les zones hachurees, c' est-a-dire 

limitee a la fraction de 1' estimation majoree 3^^^; aes 

composantes spectrales du bruit qui depasse la courbe de 
masquage . 

Cette soustraction est effectuee en multipliant la 
reponse frequent ielle H'^^f du filtre de debruitage par 
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"es coniDcsar.tes spectraies S^. ^ du signal de parole 

(.-nulciplieur 64). Un mcdule 65 r-acor.snrui" alcrs le signal 
debruite dans le domaine -er.porel, en cperanc la 
transformee de Fourier rapide inverse (TrRI) inverse des 

5 echant illons de frequence 5:^^^ delivres par le mult ipl-eur 

64. Pour chaque trame, seuls I.es N/2 = 128 premiers 
echanriilons du signal produic par le module 65 sont 

delivres comme signal debruice final s , apres 
recons" ruction par addir-on-recouvremen:: avec les N/2 = 128 
C derniers echantillcns de la trame precedence (module 66) , 



a 
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REVENDICATIONS 

1. Precede de deieczLor. d'activi"e voca-e dans 
un signal de parole nuT.erique (s) crai::e par traces 
successives, dans lequel on souniec ie signal de parole 
5 un debruitage en tienanc ccmpce d' es t imacions du brui^ 
corr.pris dans le signal. m:Lses a ]OLir pour chaque rrame 
c' une rr.aniere dependante d'au moins un cegre d'ac-ivite 
vccale (Y •) determine pour ladire zrarr:e, caracterise en 
ce qu'on precede a un debruitage a priori du signal de 
10 parole de cnacue trame sur la base d' est xnar ions gu bruit 
( a'^_^i B^_^- ,) obtenues lors du traitement d' au moins une 
zrane precedente, et on analyse les variations d'energie 
du signal debruite a priori { Ep^^j^) pour detecter le degre 

d'activite vocale de ladite trame. 
-5 2. Procede selon la revendica t ion 1, dans lequel 

le degre d' activite vocale (7p_^^) est un parametre non 

bmaire . 

3. Procede selon la re vendica t ion 2, dans leque. 
le degre d'activite vccale (Y^^i) ^^'^ fonction, 

20 variant cont inCir^.en t entre 0 et 1 . 

4. Procede selon I'une quelconque des 
revendications precedentes, dans lequel les estimations du 
oruit sont obtenues dans differentes bandes f requen t ie lies 
du signal, le debruicage a prion est effectue bande par 

25 bande, et il est determine un degre d'activite vocale 

(y^ ,) pour chaque bande. 
' - - ^ — 

5. Procede selcn I'une quelconque des 
revendications precedentes, dans lequel on obtient une 
es-ina-ion du bruit 3-, ; pour la trane n dans une oande de 

30 frecuences i sous la forme : 
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cu /-g esc un facteur d' oubli corm.pris enure 0 et: 1, y^^^ 

esz ie degre d'ac::ivi':e vocale dererT.ir.e pour la tra:?.e n 
dans la bande de frequences i, et S„^. esc une Tioyenne de 

1' amplitude du spectre du signal de parole de la trarr^e n 
sur la bande i. 

6. Precede selon la revendication 5, dans lequel 

le signal debruice .a priori Ep^^^ relacive.Tient a une trarr.e 
n et a une bande de frequences i est ce la forrr.e : 

oil '^o ■ = / fl esz. ur. ennier au moms 

1 

eqal a I, t2 est un entier au r.oins egal a 0, ^.^-xl,i 

un coefficient de surest i.T.at ion deterrriine pour la trarr.e 

p-xl e- la bande et Bp. est un coefficient positif. 

7, Precede selon I'une quelconque des 
revendicat ions precedentes, dans lequel on calcule une 
estimation a long terme {E^ ^) de I'energie du signal 

debruite a oriori { Eo^ ; ) ^ et on compare cette estimation 

a long terme a une estimation instantanee (ba) de cette 
energie, calculee sur la trame en cours, pour obtenir le 
degre d'activite vocale (y^ •) de ladite trame. 
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FIG. 7. 
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